El nacimiento de la GPU fue un cambio radical impulsado por el "imperativo en tiempo real": la exigencia ineludible de renderizar escenas 3D complejas dentro de una ventana de $1/60^{th}$ de segundo (16,67 ms). Mientras que los CPUs siguieron una trayectoria multicore optimizada para ejecución serial de baja latencia, se encontraron con un límite a medida que aumentaban las resoluciones.
1. La restricción de 16,67 ms
A mediados de los años 90, los videojuegos llegaron a una crisis. Una CPU serial, encargada de la inteligencia artificial y la física, no podía calcular millones de valores de píxeles lo suficientemente rápido como para mantener un movimiento fluido. Esto obligó a crear hardware dedicado para desahogar la repetitiva pipeline gráfico.
2. Interleaving de líneas de barrido (SLI)
Antes de los arreglos paralelos internos, 3dfx introdujo Interleaving de líneas de barrido (SLI). Al utilizar dos tarjetas físicas para calcular líneas horizontales alternas, la industria cambió su enfoque desde la velocidad de un solo hilo hacia un rendimiento bruto de "fuerza bruta".
3. Rendimiento frente a latencia
El origen de la GPU priorizó el área de silicio para unidades aritméticas simples en lugar de predicción compleja de ramificaciones. Esta filosofía de "ancho y lento" permitió a las GPUs manejar el cálculo repetitivo de triángulos mientras la CPU se enfocaba en lógica no paralela.